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Abstract 



The hardware has a decoupled configuration register and performs programs on a component with a single 
or multi-dimensional cell structure. Data flow or control flow graphs are partitioned into time-separated sub- 
graphs and formed sequentially and implemented on the component. An Independent claim is also included 
for a method for perfonming programs on a component with a single or multi-dimensional cell structure. 
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@ Hardware und Betriebsverfahren 

(§) Die Erfindung betrifft erne ein- oder mehrdimensfonale 
Zellstruktur. Hierbei ist eine zeitlfch getrennte Sequenzie- 
rung vorgesehen. 
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^ Beschreibung 

Aufgabe der Erfindung und Anwendungsbereiche 

s IKe vorliegende Erfindung erstreckt sich auf das Gebiet von prograntmierbaren und insbesondere wahrend des Betrie- 
bes umprogrammieibaren arithmetischen und/oder logischen Bausteinen mit Vielzahl von arithmetischen und/oder logi- 
schen Einheiten, deren Verschaliung ebenfalls piogrammierbar und wahrend des Betriebes umprogrammieibar isl. Der- 
artige logische Bausteine sind unter dem Oberbegriflf FPGA von verschiedenen Firmen verfugbar. Weiierhin sind meh- 
rerePatenle verofTenUicht, die spezielle arilhmetische Bausteine mit automatischer Datensynchronisation und verbesser- 
10 ten offenlegen. 

Samtliche beschriebene Bausteine besilzen eine zwei- oder mehrdimensionale Anordnung von logischen und/oder 
arithmetischen Einheiien, die iiber Bussysteme miteinander verschallbar sind. 

Aufgabe der Erfindung ist es, ein Programmierverfahren zur Verfiigung zu stellen, das es ermoglicht die beschriebenen 
Bausteine in gewohnlichen Hochsprachen effizient zu programmieren und dabei die Vorteile der durch die Vielzahl von 
15 Einheilen entstehende Parallelitat der beschriebenen Bausteine weilgehend aulomatisch, vollslandig und effizient zu nut- 
zen. 

Stand der Tedinik 

20 Bausteine der genannten Gattung werden zumeist unter Vcrwendung gewohnlicher Datenflussprachen programmiert. 

Dabei U-eten zwei grundlegende Probleme auf: 

1 . Die Progranunierung in Datenflussprachen ist fUr Programmierer gewdhnungsbediirftig, tief sequentielle Aufga- 
ben lassen sich nur sehr umstandlich beschreiben. 
2S 2. GroBe Applikationen und sequentielle Beschreibungen lassen sich mit den bestehenden Ubersetzungsprogram- 
men (Synthese-Tools) nur bedingt auf die gewunschte Zieltechnologie abbilden (synthetisieren). 

Fur gewohnlich werden Applikationen in mehiere Ibilapplikationen partitioniert, die dann einzeln auf die Zieltechno- 
logie synthelisiert werden (Fig. 1). Die einzelnen Binarcodes werden dann auf jeweils einen Baustein geladen. Wesent- 
30 liche Voraussetzung der Erfindung ist das in DE 44 16 881 beschriebene Verfahren, das es ermoglicht, mehrere partitio- 
nierie Teilapplikationen innerhaib eines Bausteines zu nutzen, indem die zeitliche Abhangigkeit analysiert wird und iiber 
Steuersignale sequentiell die jeweils erforderlichen Teilapplikationen bei einer iibeigeordneten Ladeeinheit angeforderl 
und von dieser daraufhin auf den Baustein geladen werden. 

Existierende Synthese-Tools sind nur bedingt in der Lage Progranun-Schleifen auf Bausteine abzubilden (Fig. 2 
35 (0201)). 

Dabei werden sogenannte FOR-Schleifen (0202) als Primitiv-Schleife haufig noch dadurch unterstutzl, daB die 
Schleife voUkomnien auf die Ressourcen des Zielbausteines ausgewalzt werden. 

WHILE-Schleifen (0203) besitzen im Gegensatz zu FOR-Schleifen keinen konstanten Abbruchswert. Vielmehr wird 
durch eine Bedingung evaluiert, wann der Schleifaiabbruch stattfindet. Daher ist gewohnlicherweise (wenn die Bedin- 
40 gung nicht konstant ist) zur Synthesezeit nicht bekannt, wenn die Schleife abbrichl. Durch das dynamische \ferhalten 
konnen Synthes&-Tools diese Schleifen nicht fest auf Hardware abgebildet d. h. auf einen Zielbaustein iibertragai wer- 
den. 

Rekursionen sind grundsatzlich nicht auf Hardware abbildbar, wann die Rekursionstiefe nicht zur Synthesezeit be- 
kannt und damit konstant ist. Bei der Rekursion werden mit jeder neuen Rekursionsebene neue Ressourcen allokiert. Das 
45 wurde bedeuten, daB mit jeder Rekursionsebene neue Hardware zur Verfiigung gestellt werden muB, was aber dynamisch 
nicht moglich ist. 

Selbst einfache Grundstrukturen sind von Synthesetools nur dann abbildbar, wenn der Zielbaustein ausreichend groB 
ist, d. h. ausreichende Ressourcen bietet. 

Einfache zeitliche Abhangigkeiten (0301) werden durch heutige Synthese-Tools nicht in mehrere Teilapplikationen 
50 partitioniert und sind deshalb nur als Ganzes auf einen Zielbaustein iibertragbar. 

Bedingte Ausfiihrungen (0302) und Schleifen iiber Bedingungen (0303) sind ebenfalls nur abbildbar, wenn ausrei- 
chende Ressourcen auf dem Zielbaustein existieren. 

ErfindungsgemaBes Verfahren 

55 

Durch das in DE 44 16 881 beschriebene Verfahren ist es mdglich Bedingungen zur Laufzeit innerfaalb der Hardware- 
strukturen der genannten Bausteine zu erkennen und derart dynamisch darauf zu reagieren, daB die Funktion der Hard- 
ware entsprechend der eingetretenen Bedingung modifiziert wird, was im wesentlichen durch das Konfigurieren einer 
neuen Struktur geschieht. 

60 Ein wesentlicher Schritt in dem erfindungsgemSBen Verfahren ist die Partitionierung von Graphen in zeitlich unabhSn- 
gige Teilgraphen. 

Der Begriff "zeitliche Unabhangigkeit" wird damit definiert, daB die Daten, die zwischen zwei Teilapphkalionen Ober- 
tragen werden durch einen Speicher, gleich welcher Ausgestaltung (also auch miltels einfacher Register), entkoppeh 
werden. Die isl besond^rs an den Stellen eines Graphen moglich, an denen eine klare SchnittsteUe mit einer begrenzten 
65 und mdglichst minimalen Menge von Signalen zwischen den beiden Teilapphkationen besteht. 

Die zeitliche Unabhangigkeit kann in groBen Graphen durch das gezielte Einfugen von klar definierten und moglichste 
einfachen Schnittstellen zum Speichem von Daten in einen Zwischenspeicher herbeigeftihrt werden (vgl. Sn in Fig. 4). 
Schl^fen weisen grundsatzlich eine starke zeitliche Unabhangigkeit auf, da sie lange Z«l iiber einer bestimmten Mcngc 
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von (zumeist) in der Schleife lokalen Variablen arbeilen und nur beim Schleifeneintritt und beim verlassen der Schleife 
eine Uberlragung der Operanden bzw. des Ergebnisses erfordem, 

Durch die zeilUche Unabhangigkeil wird erreichl» daB nach der voUslandigen Ausfuhrung einer Tfeilapplikation die 
nachfolgende Teilapplikation geladen warden kann, ohne daB irgendwelche weiteren Abhangigkeilen oder Einflusse auf- 
treien. Beim iJpeichem der Daten in den genannten Speicher kann ein Signal (Trigger) generiert werden, das die iiberge- 5 
ordneten Ladeeinheii zum Nachladen der nachsten Teilapplikation auffordert. Der Trigger kann bei der Verwendung von 
einfachen Regislem als Speicher immer generiert werden, wenn das Register beschrieben wird. Bei der ^fe^we^dung von 
Speichem, i. b. von solchen die nach dem FEFO-Prinzip arbeilen, ist die Generierung des TKggcrs von mehreren Bedin- 
gungen abhangig. 

Folgendc Bedingungen konnen beispielsweise einzeln oder kombiniert ein Trigger erzeugen: lo 

- Ergebnis-Speicher vol! 

- Operanden-Speicher leer 

- kcine neuen Operanden 

- Beliebige Bedingung innerhalb der Teilapplikation, generiert durch z. B. 15 

- Vergleicher 

- Zahler. 

Eine Teilapplikation wird im folgenden auch Modul genannl, urn die Verstandlichkeit aus Sicht der klassischen F*ro 
grammierung zu erhohen. Aus deniselben Grund werden Signale im folgenden auch Wiablen genannt. Dabei unter- 20 
scheiden sich die Variablen in einem Punkt wesentlich von herkommiichen Variablen: Jeder Variable ist ein Stalussignal 
(Ready) zugeordnel, das anzeigl, ob die Variable einen giiltigen Wert besilzt. Wenn ein Signal einen gulligen (berechne- 
ten) Wert besitzt, ist das Statussignal Ready; wenn das Signal keinen giiltigen Wert besitzt (Berechnung noch nicht ab- 
geschlossen), ist das Statussignal Not^Ready. Das Prinzip ist ausfuhrlich in der Patentanmeldung PACTO2 beschrieben. 

25 

Das Prozessormodell 

Die in den folgenden Figuren gezeigten Graphen besitzen als Graphenknolen immer in Modul, wobei davon ausge- 
gangen wird, daB mehrere Module auf einen Zielbaustein abgebildet werden konnen. Das heiSt, obwohl alle Module zeit- 
lich voneinander unabhangig sind, wird nur bei nach den Modulen eine Umkonfiguration durchgefUhrt, bzw, ein Daten- 30 
speicher eingefiigt, die mit einem vertikalen Strich und At markiert sind. Dieser Punkt wird Umkonfigurationszeitpunkl 
genannt. 

Das bedeutet zusammenfassend: 

1 . GroBe Module konnen an geeigneten Stellen partitioniert werden und in kleine zeitlich voneinander unabhangige 35 
Module zerlegt werden. 

2. Bei kleinen Modulen die sich gemetnsam auf einen Zielbaustein abgebildet werden konnen, wild auf die zeitli- 
che Unabhangigkeil verzichtet. Dadurch werden Konfigurationsschritte eingespart und die Datenverarbeitung be- 
schleunigt. 

3. Die Umkonfigurationszeicpunkte werden entsprechend der Ressourcen der Zielbausteine positioniert. Daduich 40 
ist eine beliebige Skalierung der Graphenl^ge gegeben. 

In Fig. 4a sind einige grundlegenden Eigenschaften des erfindungsgemaBen Verfahrens dargestellt: 
Die Module des Types A sind zu einer Gruppe zusammengefaBt und besitzen am Ende einen bedingten Sprung, entweder 
nach Bl oder B2. An dieser Position (0401) ist ein Urakonfigurationspunkl eingefiigt, da es sinnvoll ist die Zweige des 45 
bedingten Sprunges als jeweils eine Gruppe zu betrachten (Fall 1). Wiirden dagegen beide Zweige von B (Bl und B2) zu- 
salzlich zu A auf den Zielbaustein passen (Fall 2), ware es sinnvoll nur einen Umkonfigurationspunkt bei 0402 einzufu- 
gen, da dadurch die Zahl der Konfigurationen verringert wird und sich die Veraibeitungsgeschwindigkeit erhoht. Beide 
Zweige (Bl und B2) springen bei 0402 nach C. 

Die Konfiguralion der Zellen auf dem Zielbaustein ist in Fig. 4b schemalisch dargestellt. Dabei werden die Funktionen 50 
der einzelnen Graphenknoten auf die Zellen des Zielbausteins abgebildet. Jeweils eine Zeile steUt eine Konfiguration dan 
Die gestrichelten Pfeile bei einem Zeilenwechsel zeigen eine Umkonfiguration. So ist eine datenspeichernde Zelle, von 
beliebiger Ausgestaltung (Register, Speicher, etc.). Dabei ist SJ ein Speicher, der Daten entgegennimml und SnO ein 
Speicher der Daten ausgibt. Der Speicher S^ ist fur gleiche n jeweils derselbe, I und 0 kennzeichnen die Datentransfer- 
richtung. 55 

Beide Falle des bedingten Sprunges (Fall 1, Fall 2) sind dargestellt. 

Das Modell in Fig. 4 entspricht einem DalenfluBmodell, jedoch mit der wesentlichen Erweiterung der Umkonfigura- 
tionspunkt und der damit erreichbaien Partitionieiung des Graphen, wobei die zwischen den Parti lionen iibertragenen 
Daten zwischengespeichert werden. 

Im Modell von Fig. 5a wird aus einer beliebigen Graphenmenge und -Konstellation (0501) selektiv ein Graph aus ei- 60 
ner Menge von Graphen B aufgerufen. Nach der Ausfuhrung von B gelangen die Daten nach 0501 zuriick. 

Wird in 0501 ein ausreichend groBer Sequencer (A) implementiert, isi mit dem Model! ein den typischen Ptozessoien 
sehr ahnliches Prinzip implementierbar. Dabei gelangen 

1 . Daten in den Sequenzer A, die dieser als Befehle dekodiert und entsprechend dem "von Neumann^-Prinzip dar- 65 
auf reagiert; 

2. Daten in den Sequenzer A, die als Daten betrachtet werden und an ein fest konfiguriertes Rechenwerk C zur Be- 
rechnung weitergeleitet werden. 
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Ver Graph B steilt selektierbar ein besonderes Rechenwerke und/oder besondere Opcodes fiir bestimmte Funklionen 
zur Verfugung und wird altemaliv zur Beschleunigung von C verwendel. Beispielsweise kann Bl ein optimierter Algo- 
rithmus zu Berechnung von Matrixmultiplikationen sein, wahrend B2 einen HR-Filter und B3 cine Mustererkennung 
5 darstellt. Entsprechend eines Opcodes der von 0501 dekodiert wird, wird der geeignete bzw. entsprechende Graph B auf- 
gCTufen. 

Fig. 5b schematisiert die Abbildung auf die einzelnen Zellen, wobei in 0502 der pipelineartige Rechenwerk5>Charac> 
ter symboiisiert wird. 

Wahrend in den Umkonfigurationspunkten von Fig. 4 vorzugsweise groBere Speicher zura Zwischenspeichem der Da- 
10 ten eingefugt werden, ist eine einfache Synchronisation der Daten in den Umkonfigurationspunkten von Fig* 5 ausrei- 
chend, da der Datenstrom vorzugsweise als ganzer durch den Graphen B ISuft und der Graph B nicht weiter partitioniert 
ist; dadurch ist das Zwischenspeichern der Daten iiberfliissig. 
In Fig. 6a sind verschiedene Schleifen dargestellt. Schleifen konnen grundsatzlich auf drei Arlen behandelt werden: 

15 1 . Hardware- Ansalz: Schleifen werden vollstandig ausgewalzt auf die Zielhardware abgebildet (060la/b). Wie be- 

reits eriauleri ist dies nur bei wenigen Schleifenarten moglich. 

2. Datenfiufi-Ansalz: Innerbalb der Datenflusses werden Schleifen iiber mehrere 2^11en hinweg aufgebaul 
(0602a/b). Das Ende der Schleife wird auf den Schleifenanfang riickgekoppelt. 

3. Sequenzer- Ansalz: Ein Sequenzer mit minimalem Befehlssaiz fuhrl die Schleife aus (0603a/b). Dabei sind die 
20 Snellen der Zielbausteine so ausgestaltet, dafi sie den entsprechenden Sequenzer beinhahen (vgl. Fig. 1 1 a/b). 

Durch eine geeignete Zerlegung von Schleifen kann deren Ausfuhrung ggf. optimiert werden: 

1 . Unter Verwendung von Optimierungsmethoden nach dem Stand der Technik laBt sich haufig der Schleifen- 
25 rumpf, also der wiederholt auszufiihrende Teil, dadurch optimieren, daB bestimmte Operaiionen aus der Schleife 

entfemt werden und vor oder hinter die Schleife gestelll werden (0604a^). Dadurch wird die Menge der zu sequen- 
cenden Befehle erheblich reduziert. Die entfemten Operationen werden nur einmal vor bzw. nach Ausfuhrung der 
Schleife durchlaufen. 

2. Eine weitere Oplimierungsnioglichkeit ist das Teilen von Schleifen in mehrere kleinere oder kurzere Schleifen. 
30 Dabei findet die Teilung derart statt, daB mehrere parallele oder mehrere sequentielie (0605a/b) Schleifen entstehen. 

Fig. 7 verdeutlicht die Implementierung einer Rekursion. Dabei werden dieselben Ressourcen (0701) in Form von 
Zellen fur jede Rekursionsebene (1-3) verwendet. Die Ei^ebnisse einer jeden Rekursionsebene (1-3) werden beim Auf- 
bau (0711) in einen nach dem Stack-IVinzip aufgebauten Speicher (0702) geschrieben. Gleichzeitig mit dem Abbau 
35 (0712) der Ebenen wird der Stack abgebaut. 

Hochsprachenbeispiele 
Bin Modul kann beispielsweise folgendermaBen deklariert werden: 

40 

aodttle axanplel 

input (varl^ var2 : tyi; var3 : tyj) • 
45 output (resl, res2 : tyj) . 
bagxa 

r«9x©t«r <regnarael> (resl). 
reglstar <regnanie2> (res2) . 
55 tazminatee (resl & res2; 1). 

module kennzeichnet den Beginn eines Modules. 
60 input/output definiert die Ein-/Ausgangsvariablen mit den lypen tyn. 
begin . . . end markieren den Rumpf des Modules. 

register <regnaniel^ ubergibt das Brgebnis an den Output, wobei des Ergebnis in dem durch <regnamel/2> spezi&zier- 
ten Register zwischengespeichert wird. <regname l/2> ist dabei eine globale Referenz auf ein bestimmtes Registen 
Als weitere Obergabemodi an den Output stehen beispielsweise folgende Speicherarten zur VerfUgung: 
65 fifo <fifoname>, wobei die Daten an einen nach dem FIFO-Prinzip arbeitenden Speicher Obeigeben werden. fifoname iBl 
dabei eine globale Referenz auf einen bestimmten, im FIFO-Modus arbeitenden Speicher, terminate® wird dabd um 
den Parameter bzw, das Signal, "fifofijir' erweitert, der/das anzdgt, daB dor Speicher voll ist. 

slack <stackname>, wobei die Daten an einen nach dem Stack-Prinzip arbeitenden Speicher iibeigeben werden. stack- 
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name ist dabei eine globale Referenz auf einen bestimmten, im Stack-Modus arbeitenden Speicher. 
terminate© unterscheidet die Plnogrammiening entsprechend des erfindungsgemaBen Verfahrens von der herkonunli- 
chen sequentiellen Plrogrammierung. Der Befehl deBniert das Abbruchkriterium des Modules. Die Ecgebnisvariablen 
resl und res2 werden von terminate @ nicht mit ihrem tatsachlichen Wert evaluiert, stall dessen wird nur die Giiltigkeit 
der Variablen (also deren Siaiussignal) gepriift. Sind beide Variablen giiltig, terminiert das Modul mit dem Wert 1. Das 
bedeulet, ein Signal mit dem Wen 1 wird an die ubergeordneten Ladeeinheit weiteigeleitet, woraufhin die ubergeordne- 
ten Ladeeinheit das nachfolgende Modul ladt. 

nodnle exaniple2 

input (varl, var2 : tyjf var3 : ty2) . 
output (resl : ty^) . 

register <re9nainel> (varl, var2) . 



£ifo <fifonainel> (resl, 256). 

torminatag (fifofull «fifonamel>) ; 1), 
end. 

register wird in diesem Beispiel uber input-Daten definiert. Dabei ist <regnamel> derselbe wie in example 1. Dies be- 
wirkt, dafi das Register, das die output-Daten in example! aufnimmt, die input-Daten fur example2 zur \ferfugung stellt. 
fifo definiert einen FIFO-Speicher der Tiefe 2S6 fur die Ausgangsdaten res 1. Das Full-Flag (fifofull) des F[FO-Speichers 
wird in terminate© als Abbruchkriterium verwendet. 

aodttla main 

input (inl, in2 : tyi; in3 : ty^) . 

«»tput (outl : ty*). 

begin 

define <regnamel> ; register (234) . 
define <regnaine2> : register (26) . 
do£ino <fifonamel> : fifo(4). 



(varl2, var72) = call examplel (inl. in2, in3). 
{outl) = call examplea (varl2, var72, var243). 



signal (outl). 

*»™iaete8 (example2) . 
end. 

define definiert eine Schnittstelle fur Daiai (Register, Speicher, etc.). Bei der Definition werden die erforderlichen Res- 
sourcen, sowie die Bezeichnung der Schnittstelle angegeben. Da die Ressourcen eindeutig angegeben werden und nur 
einmal venvendet weiden kdnnen, ist die Definition global, d. h. die Bezeichnung gilt ttir das gesamte Programm. 
call ruit ein Modul als Unterprogramm auf. 

signal definiert ein Signal als Ausgangssignal, ohne daB cine Zwischenspdcherung venvendet wird. 

Durch terminated (exampie2) wild das Modul main terminiert, sobald das Unterprogramm example2 terminiert. 

Durch die globale Deklaration "define . . ist es prinzipiell nicht mehr notwendig» die so definierten input/output Si- 
gnalc in die Schnittstellen-Deklaration der Module aufzunehmen. Die entsprechend modifizierten Beispiel-Module wiir- 
den dann folgeodermaBoi aussehen: 
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5 Die Zuslandsinformaiionen des Prozessormodells 

Zur Bestimmung der Zuslande innerhalb eines Graphen werden die Stalusregister der einzelnen Zellen (PAEs) Uber 
ein zusalziich zum Daienbus (0801) existierendes Status-Bussyslem (0802) alien anderen Rechenwerken zur Verfugung 
gestelJi (Fig. 8b). Das bedeutet, daB cine Zelle (PAE X) die Sialusinformation einer anderen Zelle (PAE Y) evaluieren 
10 kann und demenlsprechend die Dalen verarbeilel. Um den Unterschied zu bestehenden Parallerechnersyslenien zu ver- 
deutlichen, ist in Fig. 8a der Stand der Technik angegeben. Dabei ist ein Multiprozessorsystem gezeigt, dessen Prozes- 
soren iiber einen gemeinsamen Daienbus (0803) miteinander verbiinden sind. Ein explizites Bussystem fur den synchro- 
nen Austausch von Daten und Status existiert nicht. 

AbschlieBend soil angemerkt werden, daB je nach Aufgabe sowohl derDatenfluBgraph, als auch der KontrollfluBgraph 
15 entsprechend dem beschriebenen Verfahren behandelt werden kann. 

Erweiteningen in der Hardware gegenuber PACT02 und PACr04 

Durch PACT02 und PACT04 ist der Stand der Technik in Bezug apf die Konfigiurationseigenschaften von Zellen (PA- 
20 Es)definiert und veroffenUicht in DE 196 51 075 (PACTO2) sowie in DE 196 54 846 (PACT04). 
Dabei soil auf zwei Eigenschaften eingegangen werden: 

1. Einer PAE ist gemaB PACTOZ ein Salz von Konfiguralionsregislem zugeordnet, der einc Konfiguration beinhal- 
let (Fig. 8a). 

25 2. Sine Gruppe von PAEs kann gemaB PACr04 auf einen Speicher zum Speichem oder Lesen von Daten zugieifen 
(Fig. 8b). 

Aufgabe ist es, 

30 a) ein Verfahren zu schaffen, das das Umkonfigurieren von. PAEs beschleunigt und zeitlich von der ubergeordneten 

Ladeeinheii enikoppelL, und 

b) das Verfahren so auszulegen, daB gleichzeitig die Moglichkeit geschaifen wird iiber mehrere Konfigurationen zu 
Sequenzen. 

35 

Enlkopplung der Konfigurationsregister 

Das Konfigurationsregister wird von der ubergeordneten Ladeeinheit (CT) entkoppelt (Fig. 9), indem ein Satz von 
mehreren Konfiguralionsregislem (0901) verwendet wird. Immer genau eines der Konfigurationsregister bestinunl sc- 
40 lektiv die Funktion dar PAE. Die Auswahl des aktiven Registers wird iiber einen Multiplexer (0902) durchgefiihrt. In je- 
des der Konfigurationsregister kann die CT beliebig schreiben, sofem dieses nicht die aktuelle Konfiguration der PAE 
beslimml. Welches Konfigurationsregister von 0902 selektiert wird kann durch verschiedene Quellen bestinunl werden: 

1 . Ein beliebiges Status-Signal oder eine Gruppe beliebiger Status-Signale, die iiber ein Bussystem (0802) an 0902 
45 gefiihrt werden (Fig. 9a). Die Stalus-Signale werden dabei von beliebigen PAEs generiert oder durch exteme An- 

schliisse des Bausteins zur Verfugung gestellt (vgl. Fig. 8). 

2. Das Status-Signal der PAE, die von 0901/0902 konfiguriert wird, dient zur Seleklion (Fig. 9b). 

3. Ein von der ubergeordneten CT generiertes Signal dient zur Selektion (Fig. 9c). 

SO Dabei ist es moglich wablweise die eingehenden Signale (0903, 0904, 0905) mittels eines Registers fiir einen be- 
stimmten Zeitraum zu speichem. 

Durch den Einsatz mehrere Register wird die CT zeitlich entkoppelt Das bedeutet, die CT kann mehreie Konfigura- 
tioiien "vorladen", ohne dafi eine diiekte zeitliche AbhSngigkeit besteht. 
Lediglich das selektierte Register in 0901 noch nicht geladen ist, wird mit der Konfiguration der PAH so lange gewar- 
55 tet, bis die CT das Register geladen hat. Um festzustellen, ob ein Register eine giiltige Information besitzt kann ein 
lid-Bit" (090^ pro Register eingefiihrt werden, das von der CT gcsetzt wird. Ist 0906 bei einem selektierten Register 
nicht gcsetzt, wird iiber ein Signal die CT zum schnellstmoglichen Setzten des Registers aufgefordert. 

Das in Fig. 9 beschriebene Verfahren ist einfach zu einem Sequenzer erweiteibar (Fig. 10). Dazu wird ein Mikrokon- 
troUer (1001) zur Ansteuerung der Selektionssignale des Multiplexers (0902) verwendet. Der Sequenzer bestimmt dabei 
60 abhangig von der aktuell selektierten Konfiguration (1002) und einer zusatzlichen Statusinformation (1003/1004) die 
nachste zu selektierende Konfiguration. Dabei kann die Statusinformation 

(a) der Status der Status-Signal der PAE, die von 0901/0902 konfiguriert wird sein (Fig. 10a). 

(b) ein beliebiges iiber 0802 zugefuhrtes Slatussignal sein (Fig, 10b). 
65 (c) eine Kombination aus (a) und (b) sein. 

Zum einfachen Verstandnis kann 0901 als ein Speicher betrachtet werden, wobei uber 0902 ein Befehl von 1001 adres- 
siert wird. Die Adressierung ist dabei abhangig vom Befehl selbst und von einem Statusregistec Insoweit entspicht der 
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Aufbau einer "von Neumann** Maschine, mil dem Unterschied, 

(a) der universellen Einsetzbarkeil, also den Sequenzer nichl zu venvenden (vgl. Fig. 9) 

(b) daB das Stalussignai nichl von dem dem Sequenzer zugeordnelen Rechenwerk (PAE) generiert werden muB, 
sondem von einem beliebigen anderen Rechenwerk stammen kann (vgl. Fig. 10b). 5 

Wichlig ist, daB der Sequenzer dabei Spriinge, insbesondere auch bedingte Spriinge, innerhalb von 0901 ausftihren 
kann. 

Ein weiteres zusatzliches oder allemalives Verfahren (Fig. 1 1) zum Aufbau von Sequenzem innerhalb der genannlen 
Bausteine ist die Venvendung der inlemen Oalenspeicher (1101) zum Speichem der Konfiguraiionsinformalion fiir eine 10 
PAR Dabei wird der Datenausgang eines Speichers auf einen Konfiguralionseingang einer PAE geschaltei (1102). Die 
Adresse (1103) fiir 1101 kann dabei von derselben PAE oder einer beliebigen anderen generiert werden. 

Bei diesem Verfahren isl der Sequenzer nichl fest implemenliert, sondem wird durch eine PAE oder eine Gruppe von 
PAEs nacbgebildel. 



Patentanspriiche 
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1. Verfahren zum Ausfuhren von Programmen auf einem Baustein mil ein- oder mehrdimensionaler Zellstruktur, 
dadurch gekennzeicbnet, dass Daienfluss- oder KonlroUflussgraphen in zeitlicb getrennte Teilgraphen partitioniert 
werden und sequentiell auf den Baustein abgebildet und ausgefiihrt werden. 20 

2. Hardware mil entkoppellem Konfigurationsregister. 
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